Obiettivi di Apprendimento
- Identificare i collo di bottiglia architettonici utilizzando Omniperf e ROCProfiler.
- Ottimizzare i pattern di accesso alla memoria per massimizzare la larghezza di banda di HBM2e/HBM3.
- Comprendere la pianificazione dei wavefront e l'occupazione nell'unità di calcolo CDNA.
- Implementare ottimizzazioni a livello di istruzione per i core vettoriali e matriciali.